安装NVIDIA-DOCKER驱动

NVIDIA-DOCKER 是专门针对使用 NVIDIA GPU 的容器应用程序设计的 Docker 工具。它允许用户在容器中使用 NVIDIA GPU 进行加速计算,并提供与 NVIDIA GPU 驱动程序和 CUDA 工具包的集成。

NVIDIA-DOCKER 驱动支持在线与离线两种安装方式,您可以按需选择:

在线安装

  1. 参考官方文档完成前置环境准备
  2. 在线配置生产存储库

    curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \ && curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \ sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \ sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list

  3. 在线配置存储库使用实验包(可选)

    sed -i -e '/experimental/ s/^#//g' /etc/apt/sources.list.d/nvidia-container-toolkit.list

  4. 在线安装NVIDIA Container Toolkit包

    sudo apt-get install -y nvidia-container-toolkit

  5. 在线安装NVIDIA-docker2包

    sudo apt-get install -y nvidia-docker2

离线安装

以离线方式安装 NVIDIA-DOCKER 驱动时,您可以前往网盘的“ded”文件夹获取NVIDIA Container Toolkit安装包,并参考如下步骤完成安装。

注意:

使用离线方式安装时,需确保Docker版本高于19。

  1. 解压 NVIDIA Container Toolkit 离线安装包

    tar -xzvf toolkit-deb.tar.gz

  2. 进入离线安装包所在目录,执行安装

    cd toolkit-deb

    sudo dpkg -i *.deb

  3. 验证 NVIDIA Container Toolkit 是否安装成功

    nvidia-ctk --version

  4. 配置 Docker 环境以使用 NVIDIA runtime

    sudo nvidia-ctk runtime configure --runtime=docker

  5. 重启 Docker 服务以使配置生效

    sudo systemctl restart docker

  6. 检查 Docker 配置文件,确认 NVIDIA runtime 已设置为默认(可选)

    cat /etc/docker/daemon.json